Extraction de motifs fréquents pour l'auto-administration des bases de données
نویسندگان
چکیده
With the development of databases in general and data warehouses in particular, it is now very important to reduce the database administration function. The aim of autoadministrative systems is to administrate and adapt themselves automatically, without loss (or even with a gain) in performance. The idea of using data mining techniques to extract useful knowledge for administration from the data themselves has been in the air for some years. However, no research has ever been achieved as far as we know. This nevertheless remains a very promising approach, notably in the field of data warehousing, where queries are very heterogeneous and cannot be interpreted easily. The aim of this study is to search for a way of extracting from stored data themselves useful knowledge to automatically apply performance optimization techniques, and more particularly indexing techniques. We have designed a tool that extracts frequent itemsets from a given workload to compute an index configuration that helps optimizing data access time. The experimentations we performed showed that the index configurations generated by our tool allowed performance gains of 15 to 25% on a test database and a test data warehouse. MOTS-CLÉS : Bases de données, Entrepôts de données, Indexation automatique, Fouille de données, Motifs fréquents.
منابع مشابه
Extension des bases de données inductives pour la découverte de chroniques
Résumé. Les bases de données inductives intègrent le processus de fouille de données dans une base de données qui contient à la fois les données et les connaissances induites. Nous nous proposons d’étendre les données traitées afin de permettre l’extraction de motifs temporels fréquents et non fréquents à partir d’un ensemble de séquences d’évènements. Les motifs temporels visés sont des chroni...
متن کاملExtraction de propriétés correctes dans des bases de données incomplètes
Résumé : Les valeurs manquantes dans les bases de données posent de nombreuses difficultés lors de processus d’extraction de connaissances et les propriétés extraites sont parfois incorrectes. Nous proposons à l’aide de calculs menés dans une base incomplète de caractériser des propriétés de la base complète dont la base de calcul est issue. Les propriétés de k-liberté sont étudiées, elles sont...
متن کاملMotifs récursifs : extraction ascendante hiérarchique d'ensembles d'items ou d'évènements pour le résumé de données transactionnelles ou séquentielles
Résumé. Nous proposons une méthode originale pour extraire un résumé compact, représentatif et intelligible des motifs fréquents dans des données transactionnelles ou séquentielles. Notre approche consiste à extraire un nouveau type de motifs que nous appelons motifs récursifs, i.e. des motifs de motifs, à l’aide d’un algorithme hiérarchique agglomératif nommé RepaMiner. Nous générons non pas u...
متن کاملDétection de données aberrantes à partir de motifs fréquents sans énumération exhaustive
Résumé. La détection de données aberrantes (outliers) consiste à détecter des observations anormales au sein des données. Durant la dernière décennie, des méthodes de détection d’outliers utilisant les motifs fréquents ont été proposées. Elles extraient dans une première phase tous les motifs fréquents, puis assignent à chaque transaction un score mesurant son degré d’aberration (en fonction du...
متن کاملVers une nouvelle approche d'extraction des motifs séquentiels non-dérivables
Résumé. L’extraction de motifs séquentiels est un défi important pour la communauté fouille de données. Même si les représentation condensées ont montré leur intérêt dans le domaine des itemsets, à l’heure actuelle peu de travaux considèrent ce type de représentation pour extraire des motifs. Cet article propose d’établir les premières bases formelles pour obtenir les bornes inférieures et supé...
متن کامل